AI032
Lập trình các bộ xử lý song song quy mô lớn: Tiếp cận thực hành
Tối ưu hóa bộ nhớ và chia nhỏ bộ nhớ chung
Mục tiêu học tập
- Hiểu được cấu trúc phân cấp của bộ nhớ GPU và đặc điểm độ trễ
- Nhận diện các mẫu để hợp nhất bộ nhớ toàn cục
- Thực hiện chiến lược chia nhỏ 1D và 2D bằng cách sử dụng bộ nhớ chung
- Phân tích và giảm thiểu xung đột ngân hàng bộ nhớ chung
- So sánh lợi ích hiệu suất giữa các triển khai có chia nhỏ và không chia nhỏ